%\newcommand{\specialcell}[2][c]{%
%  \begin{tabular}[#1]{@{}c@{}}#2\end{tabular}}

\chapter{Metodologia} \label{chap:metodologia}

Este capítulo dedica-se a apresentar a metodologia utilizada para a classificação de
fotos dos seis monumentos de Brasília selecionados, a saber:

\begin{itemize}
	\item Museu Nacional da República;
	\item Catedral de Brasília;
	\item Congresso Nacional;
	\item Ponte JK;
	\item Teatro Nacional de Brasília; e
	\item Memorial JK.
\end{itemize}

As duas primeiras seções indicam a sistemática utilizada para a obtenção das fotografias
que serão fornecidas como entrada para os algoritmos.
A seção seguinte apresenta uma abordagem para classificação de imagens por comparação 
de histogramas de cores.
Por fim, a última seção explicita uma metodologia que emprega redes neurais artificiais
para a resolução do problema.

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{Obtenção do Banco de Imagens}%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%


Para aumentar a confiabilidade e a validade dos resultados obtidos, foi gerado um banco de imagens contendo fotos
dos seis monumenos de Brasília selecionados. De cada monumento foram adquiridas 90 fotos, seguindo
um procedimento sistemático elaborado no intuito de se padronizar o processo de obtenção das imagens. 
Além disso, espera-se obter uma amostragem suficiente para se
caracterizar todos os monumentos, por meio da metodologia de classificação explicitada posteriormente. 
Os passos para a obtenção das fotos são descritos a seguir:

\begin{enumerate}
 \item Posiciona-se em um ponto no qual seja possível observar o monumento de seu ângulo mais relevante, normamente a entrada (posição inicial);
 \item Repete-se o procedimento a seguir por 30 vezes: captura-se uma foto e anda-se um passo para trás;
 \item Posiciona-se de maneira a observar o monumento de um ângulo de aproximadamente 45$^\circ$ graus à esquerda da posição inicial;
 \item Repete-se o procedimento a seguir por 30 vezes: captura-se uma foto e anda-se um passo para trás;
 \item Posiciona-se de maneira a observar o monumento de um ângulo de aproximadamente 45$^\circ$ graus à direita da posição inicial;
 \item Repete-se o procedimento a seguir por 30 vezes: captura-se uma foto e anda-se um passo para trás;
\end{enumerate}

\begin{figure}[H]
	\centering
	\includegraphics[width=0.8\textwidth]{imagens/capitulo3/obtencao_imagens}
	\caption{Método de Aquisição.}
	\label{fig:obtencao_imagens}
\end{figure}

A Figura~\ref{fig:obtencao_imagens} ilustra o procedimento e a Figura~\ref{fig:obtencao_imagens_congresso} algumas fotos
de exemplo para o Museu Nacional.

\begin{figure}[]
	\centering
	\includegraphics[width=1.0\textwidth]{imagens/capitulo3/museu_angulos}
	\caption{Método de Aquisição. As imagens de cima correspondem ao Museu Nacional de perto
	e as de baixo de longe (30 passos atrás). Da esquerda para a direita,
	ângulos de 45$^\circ$ à	esquerda, 0$^\circ$ e 45$^\circ$ à direita.}
	\label{fig:obtencao_imagens_congresso}
\end{figure}

Desta maneira, obtemos 90 fotos do monumento em questão, sendo 30 de cada ângulo. Devemos ressalvar que em alguns
casos não foi possível deslocar-se exatamente 45$^\circ$ graus para os lados devido à presença de obstáculos físicos (fontes 
e árvores, por exemplo). Nestes casos, foram utilizados outros ângulos que caracterizassem bem o monumento, de maneira
a não prejudicar a qualidade das imagens. 

No restante do texto o conjunto de imagens obtidas pelo método descrito nesta seção
será referenciado como banco de imagens ou imagens do banco. 
As fotos do banco de imagens serão utilizadas para a o treinamento 
das redes neurais e para a etapa equivalente da outra metodologia
abordada, o estabelecimento de limiares.


%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{Obtenção das Imagens de Teste}%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

Para a avaliação do desempenho dos métodos abordados, é necessário que se 
tenha um outro conjunto de imagens, com elementos distintos do conjunto de treinamento 
(no caso, o banco de imagens). Por este motivo, foram capturadas outras 60 fotos,
sendo 10 para cada um dos seis monumentos. Estas fotos foram capturadas na tentativa de 
simular o comportamento  de um visitante, sem que nenhum critério fosse estabelecido. 

A Figura~\ref{fig:obtencao_imagens_teste} apresenta alguns exemplos de fotografias
que compõe o conjunto de testes:

\begin{figure}[H]
	\centering
	\includegraphics[width=0.3\textwidth]{imagens/capitulo3/teste_museu_1}
	\includegraphics[width=0.3\textwidth]{imagens/capitulo3/teste_museu_2}
	\includegraphics[width=0.3\textwidth]{imagens/capitulo3/teste_museu_3}
	\caption{Imagens de Teste.}
	\label{fig:obtencao_imagens_teste}
\end{figure}

Vale ressaltar que as imagens de teste foram capturadas em um dia diferente do dia em que foram obtidas
as imagens do banco, de forma a tentar minimizar as semelhanças entre as condições de ambientação
e clima, focando nas características dos monumentos e tornando os resultados menos tendenciosos.

Este conjunto será referido no texto como conjunto de teste ou imagens de teste.
Todas as imagens dos dois conjuntos mencionados (teste e banco) foram capturadas de um celular 
modelo iPhone 4, na resolução 1936x2592 e utilizando as configurações padrões do aparelho.

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{Classificação por Histogramas de Cores}%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

Inicialmente, utilizou-se uma abordagem que visa avaliar se a simples análise
da frequência de ocorrência das cores seria suficiente para distinguir as imagens de cada
monumento de Brasília. Com esta finalidade, construiu-se histogramas de cores
que serviram de ponto de partida para os estudos.

Foram utilizadas todas as combinações dos seguintes atributos, para que se pudesse
avaliá-los:

\begin{itemize}
	\item Tamanho da imagem: 100\%, 50\% e 25\%;
				%(ver seção~\ref{sec:redimensionamento});
	\item Espaço de cores: RGB e YCbCr;
				%(ver subseções~\ref{sub:rgb} e~\ref{sub:ycbcr});
	\item Métodos de comparação de histogramas: correlação, chi-quadrado e bhattacharyya.
				%(ver seção~\ref{sec:comparacao_histograma}).
\end{itemize}

Cada combinação destes atributos será referenciada no texto como \textit{configuração}.
A título de se obter uma melhor didática e uma vez que os procedimentos utilizados são 
completamente análogos, os tópicos seguintes utilizam como exemplo a seguinte configuração:

\begin{itemize}
	\item Imagem com tamanho original (100\%);
	\item Espaço de cores RGB;
	\item Correlação como método de comparação de histogramas.
\end{itemize}

Os resultados obtidos com todas as possíveis configurações são analisados 
no capítulo~\ref{chap:resultados}.

\subsection{Obtenção de Limiares} \label{sub:obtencao_limiares}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

Em primeiro lugar, elaborou-se histogramas das frequências de cores para cada imagem do banco.
Desta forma, para cada uma das 540 imagens, foram obtidos três histogramas, um para cada
componente RGB. Foram utilizados 256 baldes, um para cada nível de intensidade da
componente. A Figura~\ref{fig:imagem_e_histogramas} apresenta uma foto do Congresso Nacional e 
seus respectivos histogramas.

\begin{figure}[H]
	\centering
	\includegraphics[width=0.8\textwidth]{imagens/capitulo3/congresso_histogramas}
	\caption{Imagem do Congresso Nacional e seus respectivos histogramas das componentes RGB.}
	\label{fig:imagem_e_histogramas}
\end{figure}

Comparou-se então, para cada componente de cor, todas as fotos do banco com todas as 
outras imagens do próprio banco utilizando-se o método da correlação. A título de exemplo,
como existem 90 fotos do Congresso Nacional, o número de resultados para comparações de 
Congresso com Congresso (denominadas Congresso-Congresso) é obtido pela fórmula
(raciocíneo análogo pode ser utilizado para os outros monumentos):

\begin{equation}
  \binom{90}{2} = \frac{90!}{2!(90-2)!} = 4005
\end{equation}

Já o número de comparações entre o Congresso e um único outro monumento (Congresso-Outros) é dado por:

\begin{equation}
  90 \times 90 = 8100
\end{equation}

Como temos ao todo seis monumentos, o número de comparações entre o Congresso e todos os outros monumentos (Congresso-Outros)
é obtido por:

\begin{equation}
  5 \times 8100 = 40500
\end{equation}

Por fim, temos o número total de comparações com o Congresso:

\begin{equation}
  4005 + 40500 = 44505
\end{equation}

A partir dos valores para a correlação obtidos, para cada componente de cor elaborou-se dois novos 
histogramas: um contendo os resultados das comparações Congresso-Congresso e outro com os resultados
das comparações Congresso-Outros.
Analogamente, os passos descritos também foram realizados para cada um dos outros monumentos.
A Figura~\ref{fig:histograma_comparacoes} exemplifica os histogramas obtidos, apresentando o resultado
do procedimento para o Congresso Nacional:

\begin{figure}[H]
	\centering
	\includegraphics[width=0.49\textwidth]{imagens/capitulo3/histograma_2217_congresso_congresso_green_correl}
	\includegraphics[width=0.49\textwidth]{imagens/capitulo3/histograma_2217_congresso_outros_green_correl}
	\caption{Respectivamente, histogramas das comparações por correlação das componentes verdes de Congresso-Congresso 
					e Congresso-Outros.}
	\label{fig:histograma_comparacoes}
\end{figure}

O histograma da esquerda é resultado das comparações Congresso-Congresso (apenas componente verde) 
e, como foi utilizada a
correlação, é de se esperar que a concentração dos valores fique mais próxima de 1 (conforme explicado
na Seção \ref{sub:correlacao}, o valor 1 indica que as imagens são mais correlacionadas). De maneira contrária,
no segundo histograma a concentração dos dados encontra-se mais perto de zero, pois as imagens correspondem
a monumentos diferentes (Congresso-Outros).

No próximo passo, os histogramas são soprepostos conforme a Figura~\ref{fig:histograma_sobrepostos}:

\begin{figure}[H]
	\centering
	\includegraphics[width=0.75\textwidth]{imagens/capitulo3/histograma_2217_congresso_outros_sobreposto_green_correl}
	\caption{Histogramas sobrepostos das comparações por correlação das compontentes verdes de Congresso-Congresso 
					e Congresso-Outros.}
	\label{fig:histograma_sobrepostos}
\end{figure}

A diferença entre o tamanho dos histogramas se deve ao fato de o número de comparações 
Congresso-Outros ser muito maior do que as Congresso-Congresso.

Seguindo a metodologia proposta, define-se um limiar para a correlação de maneira a tentar separar
as imagens que são do monumento das imagens que não são. Tal limiar é construído de maneira 
a maximizar a \textit{F-measure}, conforme a Figura~\ref{fig:histogramas_limiar}.

\begin{figure}[]
	\centering
	\includegraphics[width=0.75\textwidth]{imagens/capitulo3/histograma_2217_congresso_threshold_green_correl}
	\caption{Limiar que separa os histogramas Congresso-Congresso e Congresso-Outros do ponto de vista
				ótimo para a \textit{F-measure}.}
	\label{fig:histogramas_limiar}
\end{figure}

A Figura~\ref{fig:histogramas_limiar} apresenta o limiar ótimo (do ponto de vista da \textit{F-measure}) para o exemplo.
Graficamente os valores utilizados para o cálculo da \textit{F-measure} são obtidos da seguinte 
forma\footnote{
No caso das outros métodos de comparação (chi-quadrado e bhattacharyya), a lógica se inverte, 
uma vez que valores próximos a zero indicam uma maior semelhança. Nestes casos, temos: 
TP - histogramas Congresso-Congresso à esquerda do limiar; 
TN - histogramas Congresso-Outros à direita do limiar;
FP - histogramas Congresso-Outros à esquerda do limiar;
e FN - histogramas Congresso-Congresso à direita do limiar.
}:

\begin{itemize}
	\item Verdadeiros-Positivos (TP): ocorrências do histograma Congresso-Congresso que se encontram 
				à direita do limiar;
	\item Verdadeiros-Negativos (TN): ocorrências do histograma Congresso-Outros que se encontram
				à esquerda do limiar (este valor não é necessário para o cálculo da \textit{F-measure});
	\item Falsos-Positivos (FP): ocorrências do histograma Congresso-Outros que se encontram 
				à direita do limiar;
	\item Falsos-Negativos (FN): ocorrências do histograma Congresso-Congresso que se encontram
				à esquerda do limiar.
\end{itemize}

Por meio desta metodologia, calculou-se todos os limiares de cada componente de cor 
de cada classe de monumentos,
para cada configuração (três tamanhos de imagens, três métodos de comparação de 
histogramas e dois espaços de cores).
A maneira como utilizou-se estes limiares para a classificação será descrita na
seção seguinte.


\subsection{Sistema de Classificação} \label{sub:sistema_votos}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

De posse de uma imagem de teste $t$, de classe desconhecida, elabourou-se um sistema
de classificação que permite a categorização da mesma.

\begin{enumerate}
	\item Elaboram-se os histogramas de cada componente de $t$;
	\item Elaboram-se os histogramas de cada componente de uma foto $b$ do banco (a categorização
			desta imagem foi realizada manualmente);
	\item Compara-se os histogramas das fotos componente-a-componente, obtendo-se os 
			resultados $r_{1}$, $r_{2}$ e $r_{3}$;
	\item Compara-se os valores $r_{1}$, $r_{2}$ e $r_{3}$ com os respectivos limiares 
			$l_{1}$, $l_{2}$ e $l_{3}$ (computados anteriormente) para o monumento de $b$ 
			e a configuração sendo utilizada;
	\item Computa-se os votos da seguinte forma\footnote{
				Novamente, no caso dos métodos batthacharyya e correlação, a lógica se inverte e temos:
				se $r_{x} < l_{x}$, a componente vota \textit{sim}; se $r_{x} > l_{x}$ a componente vota
				\textit{não}.
		}:
		\begin{itemize}
			\item Se $r_{x} > l_{x}$, dize-se que a componente $x$ vota \textit{sim} ($t$ pertence à mesma classe de $b$);
			\item Se $r_{x} < l_{x}$, dize-se que a componente $x$ vota \textit{não} ($t$ pertençe à uma classe diferente de $b$).
		\end{itemize}
\end{enumerate}

Tal procedimento é realizado para todas as imagens $b$ do banco. Assim, cada componente de
cada imagem do banco vota se $t$ percetence à sua classe ou não. De posse de todos os votos,
projetou-se a seguinte sistemática para se obter o resultado final (a classe de $t$):

\begin{enumerate}
	\item Calcula-se o número de imagens $b$ que votaram \textit{sim} nas três componentes, para
			cada classe; Se houver uma classe vencedora, diz-se que esta é a classe
			de $t$. No caso de empate, segue o passo seguinte;
	\item Calcula-se o número de imagens $b$ que votaram \textit{sim} em ao menos duas das três componentes, para
			cada classe; Se houver uma classe vencedora, diz-se que esta é a classe
			de $t$. No caso de empate, segue o passo seguinte;
	\item Calcula-se o número de imagens $b$ que votaram \textit{sim} em ao menos uma das três componentes, para
			cada classe; Se houver uma classe vencedora, diz-se que esta é a classe
			de $t$. No caso de empate, segue o passo seguinte;
	\item Em um caso real, o algoritmo informaria que não foi capaz de realizar a classificação.
			No contexto deste trabalho, como as respostas já são conhecidas, computou-se 
			o resultado de $t$ como sendo um verdadeiro-negativo ou um falso-negativo.
			Por exemplo, se $t$ é uma foto do Congresso e está sendo avaliado o Congresso,
			computa-se o resultado como um FN. Por outro lado, no caso de $t$ ser uma foto do Congresso
			e estiver sendo avaliado algum outro monumento, computa-se o resultado como um TN.
			Assim, assumimos o resultado de maior probabilidade e que causa menos impacto na \textit{F-measure}
\end{enumerate}

A ideia por trás deste algoritmo é identificar quais das imagens do banco são mais semelhantes
à imagem desconhecida. Como o banco tenta captar o monumento sob diversas pespectivas, é de 
se esperar que a imagem $t$ possua mais votos das imagens $b$ que sejam do mesmo monumento e
de ângulos semelhantes.


\subsection{Avaliação dos Resultados}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

A métrica adotada para a medição do desempenho da metodologia
de classificação das fotos dos monumentos de Brasília por comparação de histogramas 
de cores descrita foi a \textit{F-measure}. Para tal, as 60 imagens de teste 
foram categorizadas de acordo com os procedimentos indicados na Subseção~\ref{sub:sistema_votos}
e os números de TP's, TN's, FP's e FN's calculados como mostrado a seguir.

Seja $m$ o monumento que deseja-se avaliar e $\bar{m}$ a representação de todos os outros
monumentos, pode-se calcular, para $m$:

\begin{itemize}
	\item Verdadeiros-Positivos: fotos de $m$ classificadas como $m$;
	\item Verdadeiros-Negativos: fotos de $\bar{m}$ classificadas como $\bar{m}$;
	\item Falsos-Positivos: fotos de $\bar{m}$ classificadas como $m$;
	\item Falsos-Negativos: fotos de $m$ classificadas como $\bar{m}$;
\end{itemize}

Os valores das \textit{F-measure} para todos os monumentos foram registrados e são apresentados e análisados
no Capítulo~\ref{chap:resultados} e no Apêndice~\ref{apen:histogramas}.


%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
\section{Classificação por Redes Neurais} %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

A segunda abordagem utilizada para a classificação dos monumentos de Brasília consiste
no emprego de redes neurais artificiais. Esta seção apresenta a metodologia elaborada
para atingirmos tais objetivos.

Inicialmente, serão explicados os vetores de características que foram projetados para
capturar informações de cores e formas das imagens. Posteriormente, serão indicados
os parâmetros de configuração indicados para a rede e a forma de treinamento da mesma. 
Finalmente será abordada a metodologia de avaliação dos resultados obtidos.

Será elaborada uma rede neural especializada em cada monumento, de forma que, ao se apresentar
uma foto para a rede, esta irá fornecer uma resposta binária que indica se a foto é ou não do monumento
em questão. Quando uma imagem for submetida à todas as redes, espera-se que
apenas uma apresente saída positiva.


\subsection{Seleção e Extração de Atributos}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

A escolha do vetor de atributos é fator determinante para o desempenho da rede. Portanto,
sua escolha deve ser cuidadosa. Cada elemento do vetor de característica 
será denominada característica ou atributo da imagem.

Uma abordagem trivial poderia considerar a utilização de cada píxel como um elemento do vetor de entradas.
Entre outras problemas, isto seria inviável devido à elevada resolução das fotos. 
Almejando um bom desempenho da rede neural, selecionou-se caracterísiticas que visam 
captar informações relevantes sobre a imagem em questão. 

Tais atributos foram calculados para cada imagem do banco e seus valores armazenados. 
Diversas combinações de características foram empregadas à fim de se determinar a melhor
configuração. Para a elaboração do vetor de entradas, os atributos são simplesmente concatenados. 
O texto a seguir, descreve os atributos utilizados.

\subsubsection{Média das Componentes YCbCr}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

Em primeiro lugar, extraiu-se das imagens a média simples dos valores de cada píxel para 
cada componente YCbCr. O intuito é que esses dados forneçam alguma informação de cores
para a rede e que esta seja capaz de distinguir os monumentos. 

Escolheu-se a representação
YCbCr para que fosse avaliado o impacto da componente de luminância na classificação.
Como a luminância sofre influência das condições nas quais a foto foi capturada, como
por exemplo iluminação e qualidade das lentes, espera-se que esta componente introduza
ruídos, no ponto de vista do classificador, dificultando a categorização.


\subsubsection{Projeção de Píxeis}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

A segunda técnica de extração de atributos consiste em projetar os píxeis de uma 
imagem em uma determinada direção. Inicialmente realiza-se um pré-processamento 
na imagem transformando-a em uma imagem binária. Para isto, varre-se os píxeis da imagem
classificando-os de acordo com um limiar, sendo que píxeis com valor menor do que o limiar 
tornam-se pretos (recebem o valor 0) e os píxeis com valor maior do que o limiar
tornam-se brancos (recebem o valor 1). Este limiar é calculado pelo método de Otsu,
que minimiza a variância interclasse entre píxeis pretos e brancos~\cite{Otsu}.

Para a projeção vertical, divide-se a imagem em $N$ colunas de tamanhos iguais. 
O valor de cada uma das $N$ projeções verticais é dado pela soma de todos os píxeis
brancos da coluna. Procedimento análogo é utilizado para a projeção horizontal.
A Figura~\ref{fig:projecao} ilustra o método para projeções horizontal e vertical.

\begin{figure}[H]
	\centering
	\includegraphics[width=0.88\textwidth]{imagens/capitulo3/projecao_original_e_peb}
	\caption{Projeção de píxeis. O valor da projeção de cada linha/coluna é a soma da quantidade
	de píxeis brancos na linha/coluna em questão.}
	\label{fig:projecao}
\end{figure}

Desta forma, obtém-se dois vetores de características de uma imagem, 
um com a projeção vertical, outro com a projeção horizontal. 
A ideia por trás desta técnica é tentar captar informações sobre a forma do monumento
contido na imagem.

A quantidade de linhas ou colunas utilizadas para dividir a imagem será 
referida no texto como quantidade ou número de projeções. Neste trabalho,
utilizou-se sempre o mesmo número de projeções verticais e horizontais.

Para cada uma das imagens, foram gerados seus respectivos atributos para 5, 10, 20,
30 e 40 projeções, tanto verticais quanto horizontais, a título de se comparar
qual a quantidade ideal para o método.


\subsection{Vetores de Características Avaliados}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

Para a elaboração dos vetores de características que foram apresentados às redes,
os atributos extraídos foram concatenados utilizando-se diversas combinações.
Com a finalidade de facilitar o entendimento, tais vetores foram denominados 
configurações e rotulados conforme apresentado a seguir.


\begin{itemize}

	\item Configuração A: Médias das componentes Cb e Cr;
	\item Configuração B: Médias das componentes Y, Cb e Cr;
	\item Configuração C: Projeções;
	\item Configuração D: Projeções + Médias das componentes Cb e Cr;
	\item Configuração E: Projeções + Médias das componentes Y, Cb e Cr.

\end{itemize}


O termo projeções se refere ao emprego do vetor de características resultante
da concatenação das projeções horizontais e verticais. Conforme mencionado anteriormente,
foram utilizados 5, 10, 20, 30 e 40 projeções em cada sentido, sendo que sempre são
concatenadas projeções verticais e horizontais de mesmo tamanho.


\subsection{Treinamento e Teste}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

A etapa de treinamento da rede neural requer um conjunto de entrada para o qual as 
saídas são conhecidas (conjunto de testes). Para tanto, cada uma das 540 imagens do banco 
foi classificada manualmente de acordo com o monumento correspondente. 

Utilizou-se apenas um nível para a camada oculta, variando-se o número de neurônios
nesta camada. Seja $N$ esta quantidade e $tam(V_{c})$ o tamanho do vetor de características,
inicialmente se pensou em realizar a avaliação para todas as possibilidades de $N$ no
intervalo $[1,tam(V_{c})]$. Entretanto, para evitar que o tempo de treinamento da rede fosse
muito extenso, o número de neurônios foi limitado a 30. Assim, temos que
o tamanho $N$ da camada oculta varia efetivamente no intervalo $[1,min(30, tam(V_{c}))]$.

Com o objetivo de se obter melhores resultados e de se evitar mínimos locais,
foram construídas 100 redes para cada possível valor de $N$, uma vez que o método 
escolhido para inicialização dos pesos da rede foi a inicialização aleatória.
Dentre todas as redes elaboradas para uma determinada configuração de entrada,
escolheu-se aquela que apresentou um maior valor para a \textit{F-measure} quando submetida
às 60 fotos do conjunto de testes.
 
Os seguintes parâmetros foram utilzados para o treinamento:
\begin{itemize}
    \item Algoritmo de treinamento: Levenberg-Marquardt \textit{backpropagation};
		\item Função de ativação da camada oculta: Tangente Hiperbólica Sigmoidal;
    \item Função de ativação da camada de saída: Tangente Hiperbólica Sigmoidal;
		\item Quantidade máxima de \textit{epochs}: 100;
		\item Mínima performance de gradiente: $10^{-10}$;
\end{itemize}

Além disso, para cada sessão de treinamento, escolhe-se aleatoriamente 50\% das 540 imagens do banco
como conjunto de treinamento e 50\% como conjunto de validação. Conforme mencionado anteriormente,
o conjunto de teste corresponde às 60 imagens de teste.


\subsection{Avaliação dos Resultados}
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

Para se realizar a avaliação dos resultados da metodologia abordada para classificação
dos monumentos de Brasília por meio de redes neurais artificiais, foram calculados
os valores para a \textit{F-measure} e acurácia para a melhor rede em cada caso.
Além dos valores de verdadeiro-positivo, verdadero-negativo, falso-positivo e falso-negativo
necessários, também foi registrado o número de neurônio na camada oculta que a
rede utilizou para obter o melhor resultado.

Seja $R_{m}$ uma rede treinada para identificar o monumento $m$ e $\bar{m}$ a representação
de todos os outros monumentos, temos que, para $R_{m}$:


\begin{itemize}

	\item Verdadeiros-Positivos: fotos de $m$ classificadas como $m$;
    \item Verdadeiros-Negativos: fotos de $\bar{m}$ classificadas como $\bar{m}$;
    \item Falsos-Positivos: fotos de $\bar{m}$ classificadas como $m$;
    \item Falsos-Negativos: fotos de $m$ classificadas como $\bar{m}$;

\end{itemize}


Os resultados e valores das \textit{F-measure} e acurácia são apresentados
e análisados no capítulo \ref{chap:resultados} e no apêndice~\ref{apen:histogramas}.